首页> 外文OA文献 >Jämförelse av IBM Model 4-alignment : En jämförelse av hur storleken på träningsdata påverkar tolkningsnoggrannheten och träningstiden för två alignment-modeller som översätter naturligt språk
【2h】

Jämförelse av IBM Model 4-alignment : En jämförelse av hur storleken på träningsdata påverkar tolkningsnoggrannheten och träningstiden för två alignment-modeller som översätter naturligt språk

机译:IBM Model 4对齐方式的比较:培训数据的大小如何影响两个翻译自然语言的对齐方式模型的解释准确性和培训时间的比较

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

In modern society the amount of information processed by computers is increasing everyday. Computer translation has the potential to speed up communication between humans as well as human-computer interactions. For Statistical Machine Translation word alignment is key. How large does a corpus need to be to align a natural language sentence with a simple unambiguous language? We investigate this matter by running a simple algorithm and comparing it to the results we get from an industry equivalent. The results show that the size of the corpus needs to be larger for the simplified model when there is a greater number of words per sentence. The IBM Model 4 conversely shows that the more words per sentence decrease the necessary size of the corpus to make better predictions.Thus we can conclude that corpus size is dependant on the number of terms in each sentence for both models.
机译:在现代社会中,计算机处理的信息量每天都在增加。计算机翻译具有加速人与人之间的交流以及人机交互的潜力。对于统计机器翻译,单词对齐是关键。将自然语言句子与简单明确的语言对齐需要多少语料库?我们通过运行简单的算法并将其与同等行业的结果进行比较来调查此问题。结果表明,当每个句子中包含更多单词时,简化模型的语料库大小需要更大。相反,IBM Model 4表明,每个句子中更多的单词会减少语料库的大小以做出更好的预测,因此我们可以得出结论,两种模型的语料库大小取决于每个句子中的术语数量。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号